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<! — StartFragment — >RESULT 5 
HUMORF08 

LOCUS HUMORF08 3694 bp mRNA linear PRI 24-JAN-2003 

DEFINITION Homo sapiens KIAA0022 mRNA, complete cds . 

ACCESSION D14664 

VERSION D14664.1 GI:285952 

KEYWORDS 

SOURCE Homo sapiens (human) 

ORGANISM Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

Mammalia; Eutheria; Euarchontoglires ; Primates; Haplorrhini; 

Catarrhini; Hominidae; Homo. 
REFERENCE 1 

AUTHORS Nomura, N., Miyajima,N., Sazuka,T., Tanaka,A., Kawarabayasi, Y . , 

Sato,S., Nagase,T., Seki,N., Ishikawa,K. and Tabata,S. 
TITLE Prediction of the coding sequences of unidentified human genes. I. 

The coding sequences of 40 new genes (KIAA0001-KIAA0040 ) deduced by 
analysis of randomly sampled cDNA clones from human immature 
myeloid cell line KG-1 
JOURNAL DNA Res. 1 (1), 27-35 (1994) 
PUBMED 7584026 
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AUTHORS Nomura, N., Miyajima,N., Sazuka,!., Tanaka,A., Kawarabayasi, Y . , 
Sato,S., Nagase,T., Seki,N., Ishikawa,K. and Tabata,S. 

TITLE Prediction of the coding sequences of unidentified human genes. I. 

The coding sequences of 40 new genes (KIAA0001-KIAA0040 ) deduced by 
analysis of randomly sampled cDNA clones from human immature 
myeloid cell line KG-1 (supplement) 

JOURNAL DNA Res. 1 (1), 47-56 (1994) 
PUBMED 7584028 
REFERENCE 3 (bases 1 to 3694) 

AUTHORS Ohara,0., Nagase,T., Kikuno,R. and Nomura, N. 

TITLE Direct Submission 

JOURNAL Submitted (ll-NOV-1992) Osamu Ohara, Kazusa DNA Research Institute; 
1532-3, Yana, Kisarazu, Chiba 292-0812, Japan 
(E-mail :cdnainfo@kazusa. or . jp, Tel : +81-438-52-39 13) 
FEATURES Location/Qualifiers 
source 1. .3694 

/organism="Homo sapiens" 

/mol_type=" mRNA " 

/db_xref="taxon:9606" 

/sex="male" 

/cell_line="KG-l" 

/cell_type=" Myeloblast" 
gene 1. .3694 

/gene="KIAA0022" 
5'UTR <1. .184 

/gene="KIAA0022" 
CDS 185. .697 

/gene="KIAA0022" 

/codon_start=l 
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NSNMTFDKWTDQDDDEDLVDTCAFLHIKTGEWKKGNCEVSSVEGTLCKTAIPYKRKYL 
SDNHILISALVIASTVILTVLGAIIWFLYKKHSDSRFTTVFSTAPQSPYNEDCVLWG 
EENEYPVQFD" 
3'UTR 698. .>3694 

/gene="KIAA0022" 
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Query Match 98.8%; Score 3694; DB 5; Length 3694; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 3694; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

ly 47 GCTCCGGGCCGCGCTGCCCGCGCTCCTGCTGCCGTTGCTGGGCCTCGCCGCTGCTGCCGT 105 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
lb 1 GCTCCGGGCCGCGCTGCCCGCGCTCCTGCTGCCGTTGCTGGGCCTCGCCGCTGCTGCCGT 60 

!y 107 CGCGGACTGTCCTTCATCTACTTGGATTCAGTTCCAAGACAGTTGTTACATTTTTCTCCA 166 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
lb 61 CGCGGACTGTCCTTCATCTACTTGGATTCAGTTCCAAGACAGTTGTTACATTTTTCTCCA 120 

ly 167 AGAAGCCATCAAAGTAGAAAGCATAGAGGATGTCAGAAATCAGTGTACTGACCATGGAGC 226 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

lb 121 AGAAGCCATCAAAGTAGAAAGCATAGAGGATGTCAGAAATCAGTGTACTGACCATGGAGC 180 

ly 227 GGACATGATAAGCATACATAATGAAGAAGAAAATGCTTTTATACTGGATACTTTGAAAAA 286 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
lb 181 GGACATGATAAGCATACATAATGAAGAAGAAAATGCTTTTATACTGGATACTTTGAAAAA 240 

ly 287 GCAATGGAAAGGCCCAGATGATATCCTACTAGGCATGTTTTATGACACAGATGATGCGAG 346 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
lb 241 GCAATGGAAAGGCCCAGATGATATCCTACTAGGCATGTTTTATGACACAGATGATGCGAG 300 

ly 347 TTTCAAGTGGTTTGATAATTCAAATATGACATTTGATAAGTGGACAGACCAAGATGATGA 406 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
lb 301 TTTCAAGTGGTTTGATAATTCAAATATGACATTTGATAAGTGGACAGACCAAGATGATGA 360 

ly 407 TGAGGATTTAGTTGACACCTGTGCTTTTCTGCACATCAAGACAGGTGAATGGAAAAAAGG 465 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
lb 361 TGAGGATTTAGTTGACACCTGTGCTTTTCTGCACATCAAGACAGGTGAATGGAAAAAAGG 420 

ly 467 AAATTGTGAAGTTTCTTCTGTGGAAGGAACACTATGCAAAACAGCTATCCCATACAAAAG 526 

I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
lb 421 AAATTGTGAAGTTTCTTCTGTGGAAGGAACACTATGCAAAACAGCTATCCCATACAAAAG 480 

ly 527 GAAATATTTATCAGATAACCACATTTTAATATCAGCATTGGTGATTGCTAGCACGGTAAT 586 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
lb 481 GAAATATTTATCAGATAACCACATTTTAATATCAGCATTGGTGATTGCTAGCACGGTAAT 540 

ly 587 TTTGACAGTTTTGGGAGCAATCATTTGGTTCCTGTACAAAAAACATTCTGATTCTCGTTT 646 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
lb 541 TTTGACAGTTTTGGGAGCAATCATTTGGTTCCTGTACAAAAAACATTCTGATTCTCGTTT 600 

ly 647 CACCACAGTTTTTTCAACCGCACCCCAATCACCTTATAATGAAGACTGTGTTTTGGTAGT 706 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
lb 601 CACCACAGTTTTTTCAACCGCACCCCAATCACCTTATAATGAAGACTGTGTTTTGGTAGT 660 

ly 707 TGGAGAAGAAAATGAATATCCTGTTCAATTTGACTAAGTTTTTGGTAATCTTGCACTAAG 766 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

lb 661 TGGAGAAGAAAATGAATATCCTGTTCAATTTGACTAAGTTTTTGGTAATCTTGCACTAAG 72 0 

ly 757 ACATCAACAAATGCCCTGGCAGAGATAACTTGGGAAAGATTTTAATATAAAACTTGACAT 825 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
lb 721 ACATCAACAAATGCCCTGGCAGAGATAACTTGGGAAAGATTTTAATATAAAACTTGACAT 780 

ly 827 TGGATATTAGAGCTTTAATGGTATTCCTTATTCCAGTAACATTTTTATGTACTCATCTGC 885 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
lb 781 TGGATATTAGAGCTTTAATGGTATTCCTTATTCCAGTAACATTTTTATGTACTCATCTGC 840 

ly 887 TGTGAAAAGTCTTTAGGTTCATTAAAAAAACAGGTTTTAGAAATGATCTTAGATCTAATA 946 
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I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

841 TGTGAAAAGTCTTTAGGTTCATTAAAAAAACAGGTTTTAGAAATGATCTTAGATCTAATA 90 0 

947 TAGTGATTTTAAGCATCCCGTCAAAGGCAGAATCTGTCACTTGAATGAAGGAAAGCTTAA 1005 

901 TAGTGATTTTAAGCATCCCGTCAAAGGCAGAATCTGTCACTTGAATGAAGGAAAGCTTAA 960 

1007 AGCCCAAGCAGATAAAAATAAAAGCCCAGCCTATTTGTCTTGCCTGCTGTATCTTCCCTA 1066 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

961 AGCCCAAGCAGATAAAAATAAAAGCCCAGCCTATTTGTCTTGCCTGCTGTATCTTCCCTA 1020 

1067 TTTAGTTGACCCACTTTAGTTTATATGTTTATTAGTAAACATGAAATGGGGAATAAGTGA 1126 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1021 TTTAGTT GACC C AC T T T AGT T T AT ATGT T TAT T AGT AAAC ATGAAATGGGGAAT AAGT GA 1080 

1127 TTTTAAGTACATCCCATACATTTAAATATCTTTGATAATTGTTATTTTTTTGGCAGATAA 1186 

1081 TTTTAAGTACATCCCATACATTTAAATATCTTTGATAATTGTTATTTTTTTGGCAGATAA 1140 

1187 TTCCTCTAGAATGTGTATCTTTTTATGATTTAGATGAAGAAAATTTTACAACTTTTAACA 12 46 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1141 TTCCTCTAGAATGTGTATCTTTTTATGATTTAGATGAAGAAAATTTTACAACTTTTAACA 1200 

1247 CCCCACACCAATTTTAGTTTCATTACTTTTACACACACCATTTTATCACAAATGACTCAA 1306 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1201 CCCCACACCAATTTTAGTTTCATTACTTTTACACACACCATTTTATCACAAATGACTCAA 12 60 

1307 GTTTTAATGAATGTTTATAAATTATTTGAAACAAAATATGATCGCTGTGTCCAGGATGGC 1366 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1261 GTTTTAATGAATGTTTATAAATTATTTGAAACAAAATATGATCGCTGTGTCCAGGATGGC 1320 

1367 ATAGAGAAAGCTGGCAATTAGGTTAACACTTACATATTATAGTGCCCCTTTAAGGATTTC 1426 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1321 ATAGAGAAAGCTGGCAATTAGGTTAACACTTACATATTATAGTGCCCCTTTAAGGATTTC 1380 

1427 TCTCTTGCCACCATACCTTTTGTACTTTCCCCTATACAAGATGTATCTCATTCTCCTCAA 1486 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1381 TCTCTTGCCACCATACCTTTTGTACTTTCCCCTATACAAGATGTATCTCATTCTCCTCAA 14 40 

1487 GCATTTATAAATTTTTCCTTCAATGACATGAAAACTGTGCAAGCAAAAACCGAAGAAAAA 1546 

1441 GCATTTATAAATTTTTCCTTCAATGACATGAAAACTGTGCAAGCAAAAACCGAAGAAAAA 1500 

15 4 7 CACTTAAGTACAACTGTAGTGACAGTGATCAAAGTTTTCAGTGCATTTATTGTACATTTT 16 06 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1501 CACTTAAGTACAACTGTAGTGACAGTGATCAAAGTTTTCAGTGCATTTATTGTACATTTT 1560 

1607 AAGAAAAAGGTGAAAATCATTTGGGGAGTAAAAAAATGAAAAAGCTGAAACGAGTAATTT 1666 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1561 AAGAAAAAGGTGAAAATCATTTGGGGAGTAAAAAAATGAAAAAGCTGAAACGAGTAATTT 1620 

1667 TCCTCACCATCAATAAACCAAAAACAGGAAAGATAAAGAATGTATAAATTTCACGTAAAT 1726 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1621 TCCTCACCATCAATAAACCAAAAACAGGAAAGATAAAGAATGTATAAATTTCACGTAAAT 1680 

172 7 TAGTCACGTATCACTTATCAATGGGGATACGTTCTAAGAAATGCATAGTTAGGGAATCTT 17 85 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1681 TAGTCACGTATCACTTATCAATGGGGATACGTTCTAAGAAATGCATAGTTAGGGAATCTT 17 40 

1787 GTGTGAAAATCAGCTTGTATTTACACAAACCCAGATGGTAGAGCCTATTTTGTCCCAAAC 1846 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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1741 GTGTGAAAATCAGCTTGTATTTACACAAACCCAGATGGTAGAGCCTATTTTGTCCCAAAC 1800 

18 4 7 CTACACAGCATGTTACTGTGCTGAATACTGCAGACAATTGTAACACAATATTTGTGTATC 19 06 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1801 CTACACAGCATGTTACTGTGCTGAATACTGCAGACAATTGTAACACAATATTTGTGTATC 18 6 0 

190 7 TAAATATAGAAAAGGTACAGTAAAAATATGGTCTACTAAGGAAACACTGTTCTATATGTG 1966 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1861 TAAATATAGAAAAGGTACAGTAAAAATATGGTCTACTAAGGAAACACTGTTCTATATGTG 1920 

1967 GTCCATTACTGACTGAAGTATACTGTCTAGAAGTCTGAGGCTCAAAGAAAAGTAATCCCT 2026 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1921 GTCCATTACTGACTGAAGTATACTGTCTAGAAGTCTGAGGCTCAAAGAAAAGTAATCCCT 1980 

2027 CTTCTGAATCCACACCCCATCAATTATCTTACTTTCTTCTGGGGAGATAGATAGATATAC 2086 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1981 CTTCTGAATCCACACCCCATCAATTATCTTACTTTCTTCTGGGGAGATAGATAGATATAC 2040 

2087 TATCTCACTAGCTTGACTAATGGCAACAAAGTTCCAGCTTGTGTAGTCTCTTTTTATTGA 2146 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2041 TATCTCACTAGCTTGACTAATGGCAACAAAGTTCCAGCTTGTGTAGTCTCTTTTTATTGA 2100 

2147 CCACATGAATCGAAAACACTCATCACAATTAATGGCACTATCATTAATGAGACATGAGTA 2206 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2101 CCACATGAATCGAAAACACTCATCACAATTAATGGCACTATCATTAATGAGACATGAGTA 2160 

220 7 ACTAAAAAGTGATAGAAAACTATTACAGTGCGGCTACATGGTACTGAAAATGCAGGCATT 22 66 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2161 ACTAAAAAGTGATAGAAAACTATTACAGTGCGGCTACATGGTACTGAAAATGCAGGCATT 22 20 

226 7 ACACCAGCTGTTACACAAGCACAAGCATGCTCTGTAAGAGCTTTACATTTCTGAGATTTT 2326 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2221 ACACCAGCTGTTACACAAGCACAAGCATGCTCTGTAAGAGCTTTACATTTCTGAGATTTT 2280 

2327 GTATAGTGATTGAGATGTCTATTTTATTATTGATAGACTATTACTAATGTCAATATTGAA 2386 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2281 GTATAGTGATTGAGATGTCTATTTTATTATTGATAGACTATTACTAATGTCAATATTGAA 23 40 

238 7 CACTACCCTGGAATTCCTGCCTGGTTTTCCTACCCAAATTGTACCACTCCTTGAAGAACT 2 4 46 

23 41 CACTACCCTGGAATTCCTGCCTGGTTTTCCTACCCAAATTGTACCACTCCTTGAAGAACT 2 4 00 

2447 ACAGGCACAGTAAAAAAATATGGCGTATTATGTGAACTAAAAGAGTTCTAAAGGAGTTCT 2506 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2401 ACAGGCACAGTAAAAAAATATGGCGTATTATGTGAACTAAAAGAGTTCTAAAGGAGTTCT 2460 

2507 TAAAGGAGTGGTAGAATTTGGGTAGGAAAGTGATTAAGTCCAACTTAAAACCAACAGTCT 2566 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2461 TAAAGGAGTGGTAGAATTTGGGTAGGAAAGTGATTAAGTCCAACTTAAAACCAACAGTCT 2520 

2567 CAAACGTCTACAACTACAATGTCCAATGAGCCACTAGCCACATGAGGCTATTTAAGTAAA 2626 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2521 CAAACGTCTACAACTACAATGTCCAATGAGCCACTAGCCACATGAGGCTATTTAAGTAAA 2580 

26 2 7 TTTAGTTTAAAATCCAGTTTTCGAATTACATTAGCCACATTGTCAAGTGTTCAAATCACA 26 86 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2581 TTTAGTTTAAAATCCAGTTTTCGAATTACATTAGCCACATTGTCAAGTGTTCAAATCACA 26 40 

2687 GGT GGT T AGTGGC T AC TGT AC TGGGCAAC AT AC AT T AT AGAACAT T T TC AT T AT AGGAAG 27 46 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2641 GGT GGT T AGTGGC T AC TGT AC TGGGCAAC AT AC AT TAT AGAACAT T T TC AT TAT AGGAAG 2700 
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2747 TTTTATTGGGCAGTGCTGCTCTTAAATCCTACCTTCCACTCAACTCCCATACAACTTTCT 2806 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2701 TTTTATTGGGCAGTGCTGCTCTTAAATCCTACCTTCCACTCAACTCCCATACAACTTTCT 2760 

280 7 TTTGTACATTTTGATACTTTCTACCTAATGGCAGCTCTTCCAAAATAGCTGCTTTAAACT 28 6 6 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2 761 TTTGTACATTTTGATACTTTCTACCTAATGGCAGCTCTTCCAAAATAGCTGCTTTAAACT 28 20 

2867 CTGATTTAATTTTCAATATTTGGTTTCATTTTTCAACAGGCCAAGAGGCCTCTGGTAATG 2926 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2821 CTGATTTAATTTTCAATATTTGGTTTCATTTTTCAACAGGCCAAGAGGCCTCTGGTAATG 2880 

2927 AAGTGCTATATATATATATATATGACGGAGTCTCACTGTGCTGCCCAGGCTACAGTGCAG 2986 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2881 AAGTGCTATATATATATATATATGACGGAGTCTCACTGTGCTGCCCAGGCTACAGTGCAG 29 40 

2987 TGGCTCGATCTTGGCTCTCTCCAATCTCCGCCTTGCAGGTTTTCAAGCAATTCTCCTGCC 30 46 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2941 TGGCTCGATCTTGGCTCTCTCCAATCTCCGCCTTGCAGGTTTTCAAGCAATTCTCCTGCC 3000 

3047 TCAGCCTCCTTAGTAGCTGGGACCACAGACATCTGTCACCACACCCAGCTAACTTTTTGT 3106 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3001 TCAGCCTCCTTAGTAGCTGGGACCACAGACATCTGTCACCACACCCAGCTAACTTTTTGT 3060 

3107 ATTTTTGGTAGAGACGGGGTTTCGCCATATTGACTGGGCTGGTCTCAAACTCCTGACCTC 3166 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3061 ATTTTTGGTAGAGACGGGGTTTCGCCATATTGACTGGGCTGGTCTCAAACTCCTGACCTC 3120 

316 7 AAGTGATCCACCCACCTTGGTCTCCCAAAGTGCTGGGATTACATGCGTGAGCCACCACAC 32 26 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3121 AAGTGATCCACCCACCTTGGTCTCCCAAAGTGCTGGGATTACATGCGTGAGCCACCACAC 3180 

3227 TTGGCCTACATTTTTTCTTTATATACCAGAACATCTATAACAGGCACCTTATCTACTCAT 3286 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3181 TTGGCCTACATTTTTTCTTTATATACCAGAACATCTATAACAGGCACCTTATCTACTCAT 32 40 

3287 TAGTGAAGAGATAAT TGGAT TACAC AGGC AGGC TTGT TTAC TACATCCAGAATGTAGAAA 3346 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3241 TAGTGAAGAGATAAT TGGAT TACAC AGGC AGGC TTGT TTAC TACATCCAGAATGTAGAAA 3300 

334 7 CTGCTTTCTTCAACATCTTGGTTCTAGCTAGTAATAACAATATAATTCTTTGGCAGATAT 3 4 05 

3301 CTGCTTTCTTCAACATCTTGGTTCTAGCTAGTAATAACAATATAATTCTTTGGCAGATAT 33 6 0 

3407 TCAGAATAACATTTTAAACTACATTTTCTTAGAAAATTGCATTCTTGTAGTGAGCAGTGT 3466 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3361 TCAGAATAACATTTTAAACTACATTTTCTTAGAAAATTGCATTCTTGTAGTGAGCAGTGT 3420 

3467 ATGGTCTCTTTTGTTCAGAATTTAAAACTGATAACCAATGAAAGCCTTTTCTCTTATTCC 3526 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

3 421 ATGGTCTCTTTTGTTCAGAATTTAAAACTGATAACCAATGAAAGCCTTTTCTCTTATTCC 3 4 80 

352 7 TCTACCGTCATTTACATGATAATCTGAAGCTAATATGACAATATTTAAATACTAAGTGGT 35 85 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3481 TCTACCGTCATTTACATGATAATCTGAAGCTAATATGACAATATTTAAATACTAAGTGGT 3540 



3587 ACTAGGGAACTACAAGAATACTGTAAAGCTTAAGCCATTGTTATCACTGTCATTTAGCAT 36 46 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3541 ACTAGGGAACTACAAGAATACTGTAAAGCTTAAGCCATTGTTATCACTGTCATTTAGCAT 3600 
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Qy 3647 TTAATAACAAAACTATACAGAATTATGTGCATACCAATGAATGTTTTGTACCATCTAGTT 3706 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3601 TTAATAACAAAACTATACAGAATTATGTGCATACCAATGAATGTTTTGTACCATCTAGTT 3660 

Qy 3707 AAATTTTTTAAATAAAGTTTTATGGGTTAAGCAG 3740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3661 AAATTTTTTAAATAAAGTTTTATGGGTTAAGCAG 3694 

< ! — EndFragment — > 
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